2020大数据Java面试总结(未完待续)
The following article is from 数据爱好者社区 Author 感性企鹅
导读:纪录面试的经过,成功有经验,失败则有教训。目前已找到工作,做Java大数据,月base45k,整理总结,希望对你也有帮助。
自我介绍
公司介绍,近期的三家公司,在线教育独角兽、暴风影音、创维数字
负责的项目
面向业务的需求开发,亲子系统、支付系统、秒杀抽奖等
面向基础组件封装,springboot二次封装、分布式链路追踪系统apm、分布式任务系统等
面向推荐系统开发
面向团队建设,内部技术分享,包括java并发、基础组件应用、企业开发规范、推荐技术
为什么离职找工作
现有系统已经很稳定了
希望自己能进行更好的发展,不要让自己的技术停滞
个人原因
秒杀系统介绍
抽奖服务,注意奖品内存扣减
抽奖服务,注意奖品池设计
秒杀系统
如何避免缓存雪崩
缓存雪崩分为两种:
自然雪崩(缓存服务器宕机)
非自然雪崩(缓存的key在同一时间过期)
解决方案:
数据预热
缓存高可用,异地多活
限流降级
在没有缓存的情况下加锁
redis版本
阿里云版本2.8
redis应用,不仅仅是做一个kv缓存去用吧(介绍的时候千万不要拘泥于项目,一定要把redis的功能全部阐述出来)
普通的缓存
排行榜单
分布式锁
地图坐标,附近的人
布隆过滤器(bitmap)
网站uv统计(hyperloglog)
订阅发布,可以做简易的聊天室(消息队列可以替代)
实现分布式的乐观锁(watch+multi)
支持事务操作(不支持原子性)
计数器(incrby)
redis使用的客户端
jedis
redisTemplate
lettuce,通过大名鼎鼎的netty进行的实现,需要熟悉一下
redis的IO模型
NIO,异步IO
底层是select+epoll做的实现
jvm
jvm参数配置
场景1,测试环境一台机器带很多个微服务
出现过内存溢出的情况吗?怎么解决的?
同事写的一个服务,在压测的时候出现了,开始的时候变慢,到最后出现oom的现象
spring
谈一下IOC和DI
依赖反转(开发原则中的
依赖导致原则)
自己之前搞过非IOC的项目
所有的对象都是自己手动管理
如果有一个对象跨模块使用,则需要在上层进行对象传递
过程相当痛苦
有了Spring的IOC,对象管理全部托管给spring
spring的bean被放在什么地方?
spring容器
spring容器是什么???
spring boot的启动过程
初始化过程由SpringApplication类在承接
推断应用类型,非web?web tomcat?或者web netty?
启动所有初始化处理器Initializers,
启动所有的监听器,监听器基本都是同步监听
启动context
启动环境相关
使用所有的环境变量,这个其实不经常用
启动SpringFactories的实例,都是利用AutoConfiguration的实例,也就是Springboot自动配置和零xml配置的核心,这里模仿了java的SPI机制,很多框架里面都有所使用。
主要涉及的文件,resources/META-INF的spring.factories
需要强调
springboot设置了不同的事件监听器(例如Listener的starting、环境准备好、上下文准备好等事件),利用了观察者模式。
启动过程最重要的是SpringFactoriesLoader进行自动配置的过程(此过程类似于java的spi机制,可以进行适度的发散)
微服务
你使用过的微服务架构
主要使用springboot+dubbo
需要了解spring cloud的架构
需要了解grpc的架构
对比微服务优缺点
服务治理是怎么实现的?
基础的远程调用rpc
通过实现负载均衡来实现高可用
有容错机制,
超时、重试、提供mock数据功能服务自动发现(只需要按照接口注册)
性能日志监控(这里可以通过pinpoint去实现)
服务治理中心,实现某节点的禁用(dubbo-admin)
dubbo的服务治理并优秀,主要还是使用的dubbo的高速rpc功能
在分布式系统中,你们的id是怎么处理的?(再次问,雪花算法怎么避免重复)
雪花算法
参考:https://www.bilibili.com/video/BV1xK411W7zy?from=search&seid=5732540532182464777
发散回答:雪花算法+分表键选择了id+分表数量选择不规范,导致了数据集中的问题。
1.由于雪花算法中生成的id大多数都是0结尾,这和雪花算法本身有关系,“在同一个毫秒内,如果只生成一个id的话,那么sequence必然是0,最后的id生成也就是固定的0”。
2.在进行分库分表的时候,如果选择的不是质数,而是2的n次幂,更有甚者,选择“10”的话,那么数据将非常的集中,导致了分表后的数据倾斜。
消息队列
使用过哪些消息队列?
activateMq
rabitMq
rocketMq
kafka
说一下优劣
如何实现发现定时消息
自动集成
Jenkins
发散问题
你在公司偶尔做培训,那么你最近的一次培训是什么?
mapStruct插件的相关原理与应用
分布式事务seta的简易实现
阿里云机器学习pai简介
简易爬虫的实现,实战爬取股票数据
深度学习之人脸识别
看完本文有收获?请转发分享给更多人
文章不错?点个【在看】吧! 👇